improve kml reader speed 5.1x. (#531)
authortsteven4 <13596209+tsteven4@users.noreply.github.com>
Wed, 8 Apr 2020 12:20:52 +0000 (06:20 -0600)
committerGitHub <noreply@github.com>
Wed, 8 Apr 2020 12:20:52 +0000 (06:20 -0600)
gtrnctr.cc
kml.cc
xmlgeneric.cc
xmlgeneric.h

index 831fb7b9a2b05cc59f76d460761df811517622b2..0d362f93ce69397f3d04fc7c2ac9c4e85926665b 100644 (file)
@@ -170,8 +170,7 @@ gtc_tags_to_ignore[] = {
 static void
 gtc_rd_init(const QString& fname)
 {
-  xml_init(fname, gtc_map, nullptr);
-  xml_ignore_tags(gtc_tags_to_ignore);
+  xml_init(fname, gtc_map, nullptr, gtc_tags_to_ignore);
 }
 
 static void
diff --git a/kml.cc b/kml.cc
index 7312df3253aa966501451ea7fcd278fa0909e95d..dfaaef939cfc0a8fdb524a763c9b329b8a127e2f 100644 (file)
--- a/kml.cc
+++ b/kml.cc
@@ -315,7 +315,16 @@ const char* kml_tags_to_ignore[] = {
   "kml",
   "Document",
   "Folder",
-  nullptr,
+  nullptr
+};
+
+static
+const char* kml_tags_to_skip[] = {
+  "Camera",
+  "LookAt",
+  "styleUrl",
+  "snippet",
+  nullptr
 };
 
 // The TimeSpan/begin and TimeSpan/end DateTimes:
@@ -546,8 +555,7 @@ static
 void
 kml_rd_init(const QString& fname)
 {
-  xml_init(fname, kml_map, nullptr);
-  xml_ignore_tags(kml_tags_to_ignore);
+  xml_init(fname, kml_map, nullptr, kml_tags_to_ignore, kml_tags_to_skip);
 }
 
 static
index d832fee499421b0fbaa66923ae8548c0f8f09359..15c301959a57c71959d85e2a7c79be8bbefc287b 100644 (file)
 
  */
 
+#include <QtCore/QByteArray>            // for QByteArray
+#include <QtCore/QHash>                 // for QHash
+#include <QtCore/QIODevice>             // for QIODevice, QIODevice::ReadOnly
+#include <QtCore/QLatin1Char>           // for QLatin1Char
+#include <QtCore/QStringRef>            // for QStringRef
+#include <QtCore/QTextCodec>            // for QTextCodec
+#include <QtCore/QXmlStreamAttributes>  // for QXmlStreamAttributes
+#include <QtCore/QXmlStreamReader>      // for QXmlStreamReader, QXmlStreamReader::Characters, QXmlStreamReader::EndElement, QXmlStreamReader::IncludeChildElements, QXmlStreamReader::StartDocument, QXmlStreamReader::StartElement
+#include <QtCore/QtGlobal>              // for qPrintable
+
 #include "defs.h"
-#include "cet_util.h"
-#include "src/core/file.h"
 #include "xmlgeneric.h"
-
-#include <QtCore/QByteArray>
-#include <QtCore/QDebug>
-#include <QtCore/QTextCodec>
-#include <QtCore/QXmlStreamAttributes>
-#include <QtCore/QXmlStreamReader>
+#include "src/core/file.h"              // for File
 
 #define DEBUG_TAG 0
 #if DEBUG_TAG
 #include <QtCore/QDebug>
 #endif
 
+enum xg_shortcut {
+  xg_shortcut_none = 0,
+  xg_shortcut_skip,
+  xg_shortcut_ignore
+};
+
 static xg_tag_mapping* xg_tag_tbl;
-static QSet<QString> xg_ignore_taglist;
+static QHash<QString, xg_shortcut>* xg_shortcut_taglist;
 
 static QString rd_fname;
 static QByteArray reader_data;
@@ -59,8 +68,10 @@ static QTextCodec* codec = utf8_codec;  // Qt has no vanilla ASCII encoding =(
 xg_callback*
 xml_tbl_lookup(const QString& tag, xg_cb_type cb_type)
 {
-  for (xg_tag_mapping* tm = xg_tag_tbl; tm->tag_cb != nullptr; tm++) {
-    if (str_match(CSTR(tag), tm->tag_name) && (cb_type == tm->cb_type)) {
+  const QByteArray key = tag.toUtf8();
+  const char* keyptr = key.constData();
+  for (xg_tag_mapping* tm = xg_tag_tbl; tm->tag_cb != nullptr; ++tm) {
+    if ((cb_type == tm->cb_type) && str_match(keyptr, tm->tag_name)) {
       return tm->tag_cb;
     }
   }
@@ -68,7 +79,8 @@ xml_tbl_lookup(const QString& tag, xg_cb_type cb_type)
 }
 
 void
-xml_init(const QString& fname, xg_tag_mapping* tbl, const char* encoding)
+xml_init(const QString& fname, xg_tag_mapping* tbl, const char* encoding,
+         const char** ignorelist, const char** skiplist)
 {
   rd_fname = fname;
   xg_tag_tbl = tbl;
@@ -79,6 +91,17 @@ xml_init(const QString& fname, xg_tag_mapping* tbl, const char* encoding)
       codec = tcodec;
     }
   }
+  xg_shortcut_taglist = new QHash<QString, xg_shortcut>;
+  if (ignorelist != nullptr) {
+    for (; ignorelist && *ignorelist; ++ignorelist) {
+      xg_shortcut_taglist->insert(QString::fromUtf8(*ignorelist), xg_shortcut_ignore);
+    }
+  }
+  if (skiplist != nullptr) {
+    for (; skiplist && *skiplist; ++skiplist) {
+      xg_shortcut_taglist->insert(QString::fromUtf8(*skiplist), xg_shortcut_skip);
+    }
+  }
 }
 
 void
@@ -89,12 +112,18 @@ xml_deinit()
   xg_tag_tbl = nullptr;
   xg_encoding = nullptr;
   codec = utf8_codec;
+  delete xg_shortcut_taglist;
+  xg_shortcut_taglist = nullptr;
 }
 
-static bool
-xml_consider_ignoring(const QStringRef& name)
+static xg_shortcut
+xml_shortcut(const QStringRef& name)
 {
-  return xg_ignore_taglist.contains(name.toString());
+   QString key = name.toString();
+   if (xg_shortcut_taglist->contains(key)) {
+     return xg_shortcut_taglist->value(key);
+   }
+  return xg_shortcut_none;
 }
 
 static void
@@ -107,7 +136,7 @@ xml_run_parser(QXmlStreamReader& reader)
     switch (reader.tokenType()) {
     case QXmlStreamReader::StartDocument:
       if (!reader.documentEncoding().isEmpty()) {
-        codec = QTextCodec::codecForName(CSTR(reader.documentEncoding().toString()));
+        codec = QTextCodec::codecForName(reader.documentEncoding().toUtf8());
       }
       if (codec == nullptr) {
         // According to http://www.opentag.com/xfaq_enc.htm#enc_default , we
@@ -118,11 +147,17 @@ xml_run_parser(QXmlStreamReader& reader)
       break;
 
     case QXmlStreamReader::StartElement:
-      if (xml_consider_ignoring(reader.name())) {
+      switch (xml_shortcut(reader.name())) {
+      case xg_shortcut_skip:
+        reader.skipCurrentElement();
         goto readnext;
-      }
+      case xg_shortcut_ignore:
+        goto readnext;
+      default:
+        break;
+     }
 
-      current_tag.append("/");
+      current_tag.append(QLatin1Char('/'));
       current_tag.append(reader.qualifiedName());
 
       cb = xml_tbl_lookup(current_tag, cb_start);
@@ -144,7 +179,7 @@ xml_run_parser(QXmlStreamReader& reader)
       break;
 
     case QXmlStreamReader::EndElement:
-      if (xml_consider_ignoring(reader.name())) {
+      if (xml_shortcut(reader.name()) == xg_shortcut_skip) {
         goto readnext;
       }
 
@@ -181,18 +216,11 @@ void xml_read()
 
   xml_run_parser(reader);
   if (reader.hasError())  {
-    fatal(MYNAME ":Read error: %s (%s, line %ld, col %ld)\n",
+    fatal(MYNAME ":Read error: %s (%s, line %lld, col %lld)\n",
           qPrintable(reader.errorString()),
           qPrintable(file.fileName()),
-          (long) reader.lineNumber(),
-          (long) reader.columnNumber());
-  }
-}
-
-void xml_ignore_tags(const char** taglist)
-{
-  for (; taglist && *taglist; taglist++) {
-    xg_ignore_taglist.insert(QString::fromUtf8(*taglist));
+          reader.lineNumber(),
+          reader.columnNumber());
   }
 }
 
@@ -213,11 +241,11 @@ void xml_readstring(const char* str)
 
   xml_run_parser(reader);
   if (reader.hasError())  {
-    fatal(MYNAME ":Read error: %s (%s, line %ld, col %ld)\n",
+    fatal(MYNAME ":Read error: %s (%s, line %lld, col %lld)\n",
           qPrintable(reader.errorString()),
           "unknown",
-          (long) reader.lineNumber(),
-          (long) reader.columnNumber());
+          reader.lineNumber(),
+          reader.columnNumber());
   }
 }
 
index b5f32914453c21818b8ac41ca9ac7e6c61dc0c6b..c1e97fc824137819d834871c5929881bb6f6058c 100644 (file)
@@ -22,7 +22,8 @@
 #ifndef XMLGENERIC_H_INCLUDED_
 #define XMLGENERIC_H_INCLUDED_
 
-#include <QtCore/QString>
+#include <QtCore/QString>               // for QString
+#include <QtCore/QXmlStreamAttributes>  // for QXmlStreamAttributes
 
 // Maybe the XmlGeneric string callback really shouldn't have a type
 // of its own; this was a crutch during the move from char* to QString.
@@ -37,7 +38,6 @@ enum xg_cb_type {
   cb_end,
 };
 
-class QXmlStreamAttributes;
 using xg_callback = void (xg_string, const QXmlStreamAttributes*);
 
 struct xg_tag_mapping {
@@ -47,9 +47,10 @@ struct xg_tag_mapping {
 };
 
 extern const char* xhtml_entities;
-void xml_ignore_tags(const char** taglist);
 
-void xml_init(const QString& fname, xg_tag_mapping* tbl,const char* encoding);
+void xml_init(const QString& fname, xg_tag_mapping* tbl,const char* encoding,
+              const char** ignorelist = nullptr,
+              const char** skiplist = nullptr);
 void xml_read();
 void xml_readstring(const char* str);
 void xml_readprefixstring(const char* str);